بهبود صحت ابهامزدایی نام نویسنده با استفاده از خوشهبندی تجمّعی
نویسندگان
چکیده مقاله:
Today, digital libraries are important academic resources including millions of citations and bibliographic essential information such as titles, author's names and location of publications. From the view of knowledge accumulation management, the ability to search fast, accurate, desired contents, has a great importance. The complexity and similarity in these resources cause many challenges and ambiguities. One of the most of these challenges is the author name disambiguation which makes an extensive scope of research. Although many effective methods have been developed by using clustering techniques in disambiguation of the author's name, the accuracy of these methods is not acceptable and still there are some problems such as fragmentation and error in the produced results of these methods, since there is no uniform standard of citations, various combinations, and numerous, written, verbal patterns. In fact, experiences have shown that the use of a single method to disambiguate names does not provide results with a high accuracy despite concerns expressed above. In this paper, a new method is proposed to disambiguate author names in different formats and combinations with more accuracy. The proposed solution carries out the disambiguation in two steps; In the first step, agglomerative hierarchical clustering algorithm produces clusters using similar functions and different thresholds. In the second step, clusters produced by clustering ensemble technique in the previous stage are combined to provide more accurate clusters with less fragmentation. The proposed method is experimentally evaluated by conducted DBLP datasets with K criterion. The evaluation results show that the proposed method enhances the accuracy of disambiguation of author names in different formats.
منابع مشابه
بهینهسازی پرتفوی سهام با استفاده از روش حرکت تجمعی ذرات
مسئله بهینهسازی مارکویتز و تعیین مرز کارای سرمایهگذاری، زمانیکه تعداد داراییهای قابل سرمایهگذاری و محدودیتهای موجود در بازار کم باشد، توسط مدلهای ریاضی حلشدنی است. اما هنگامیکه شرایط و محدودیتهای دنیای واقعی در نظر گرفته شود، مسئله بهینهسازی پرتفوی بهراحتی با استفاده از شیوههای ریاضی حـل نمیشود. بههمین دلیل استفـاده از شیوههای ابتکاری همچون شبکههای عصبی و الگوریتمهای تکاملی...
متن کاملهم نویسنده ای به نام و هم روانپزشکی توانا
استاد دکتر اصغر الهی در دوم اردیبهشت ۱۳۲۳ در مشهد متولد شد. تحصیلات ابتدایی و متوسطه را در همان شهر به پایان رساند و موفق به دریافت درجه دکترا در رشته پزشکی از دانشگاه علوم پزشکی مشهد شد. دکتر الهی آموزش روانپزشکی را از سال 1355 در بیمارستان روزبه آغاز کرد، اما پیش از آن مدتی را در فرانسه گذراند. قرار بود دوره تخصصی خود را در شهر پاریس طی کند، اما غربت را تاب نیاورد و زیستن در میان مردمان سرزمی...
متن کاملبهبود صحت استخراج دمای سطح زمین از باندهای حرارتی ماهوارة لندست با استفاده از رگرسیون خطی و مشاهدات زمینی
پایش تغییرات دمای سطح زمین حاصل از نوسانات فصلی و غیرفصلی به دلیل تأثیر بسیار آن بر محیطزیست انسانی و طبیعی، امری ضروری است. بهمنظور پایش پیوستة دمای سطح زمین با هزینة اندک و سرعت زیاد، از تصاویر ماهوارهای سنجش از دور استفاده میشود. در این پژوهش، نخست با بهرهگیری از سه روش متداول استخراج دما مبتنی بر رابطة پلانک، دمای سطح زمین در محدودة دریاچة ارومیه از تصاویر ماهوارة لندست استخراج شد؛ سپ...
متن کاملبررسی بهبود صحت طبقهبندی تیپ های جنگل با استفاده از ادغام دادههای ماهوارهای (مطالعه موردی: طرح جنگلداری آذررود، سوادکوه -مازندران)
برای بررسی بهبود صحت طبقهبندی تیپهای جنگلی با استفاده از دادههای ماهوارهای از دادههای چند طیفی و باند PAN سنجندهETM+ طرح جنگلداری آذررود واقع در شهرستان سوادکوه استفاده شد. باندها از نظر خطای رادیومتری و هندسی مورد بررسی و بازبینی قرار گرفتند. باند 1 بهدلیل وجود خطای رادیومتری حذف گردید. با تصحیحات هندسی ضمن رفع اثر خطای جابهجایی ناشی از پستی و بلندی با استفاده از 21 نقطه کنترل و مدل رق...
متن کاملارزیابی کارایی تکنیک نمونهگیری تجمعی بوتاسترپ بر صحت روش بهترین پیشبینی نااُریب خطی ژنومی
به منظور افزایش صحت ارزیابیهای روش بهترین پیشبینی نااُریب خطی ژنومی (GBLUP)، تکنیک نمونهگیری تجمعی بوتاسترپ (بگینگ) بکار گرفته شد. بدین منظور ژنومی حاوی 10000 نشانگر تکنوکلئوتیدی دو آللی (SNP) با فواصل یکسان روی 10 کروموزوم هریک به طول 100 سانتیمورگان شبیهسازی شد. برای ایجاد عدم تعادل پیوستگی (LD) بین SNPها و جایگاههای ژنی کنترلکنندة صفات کمی (QTL)، به مدت 100 نسل بین 100 فرد ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 14 شماره 4
صفحات 117- 128
تاریخ انتشار 2018-03
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023